人 机 信任 校准 的 双 途 径 : 信任 抑制 与 信任 提升 * 
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摘 要 信任 是 人 机 成 功 合作 的 基础 。 但 个 体 在 人 


机 交互 中 并 不 总 是 持 有 恰当 的 信任 水 平 ， 


也 可 能 会 出 现 信任 偏差 : 过 度 信 任 和 信任 不 足 。 信 任 偏差 会 妨碍 人 机 合作 ， 因 此 需要 对 信任 


未 来 研究 可 进一步 优化 校准 效果 评估 的 测量 方法 、 


人 机 协作 。 
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1 前 言 


于 如 何 提 高 个 体 对 机 器 人 较 低 的 信任 水 平 。 
揭示 信任 校准 过 程 中 以 及 信任 校准 后 个 体 
的 认 知 变化 机 制 、 探 索 信任 校准 的 边界 条 件 以 及 个 性 化 和 精细 化 的 信任 校准 策略 ， 以 期 助 扒 


进行 校准 。 信 任 校准 常常 通过 信任 抑制 与 信任 提升 两 条 途径 来 实现 。 信 任 抑制 聚焦 于 如 何 降 
低 个 体 对 机 器 人 过 高 的 信任 水 平 ,信任 提升 则 侧重 


信任 广泛 存在 于 任何 关系 的 建立 与 发 展 之 中 ， 如 亲密 关系 Rempel etal., 1985)、 消 费 关 


f&(Kwon et al., 2021)、 组 织 关 系 (Meng & Berger, 2019)、 
它 不 仅 是 人 际 交 往 的 重要 因素 ,也 是 社会 发 展 的 润滑 剂 ( 乐 国安 ， 
逐渐 走 进 人 们 的 生活 ， 研 究 者 们 发 现 信任 也 存在 了 


六 人 机 交互 之 


医 患 关系 (Petrocchi et al., 2019) 等 。 


韩 振 华 , 2009)。 随 着 机 器 人 


(Hoff & Bashir, 2015; 


Khavas, 2021)。 本 文 结合 前 人 的 研究 (高 在 峰 A, 2021; Lee & See, 2004; Mayer et al., 1995), 


将 人 机 信任 定义 为 : 个 体 在 情境 不 确定 或 具有 脆弱 性 时 , 对 机 器 人 能 帮助 己方 实现 目标 或 不 
会 利用 己方 弱点 时 所 持 有 的 信心 和 心理 预期 信任 对 于 人 机 交互 至 关 重 要 , 它 不 仅 是 人 类 使 


用 与 接受 


算法 的 前 提 (Sanders et al., 2019)， 也 是 人 机 合作 的 基础 (Esterwood & Robert, 2021). 


本 文 主要 关注 人 与 智能 机 器 人 、 算 法 、 人 工 智能 之 间 的 交互 ， 且 以 人 与 智能 机 器 人 之 间 
的 交互 为 主 。 以 智能 机 器 人 为 例 ， 人 机 交互 中 ， 个体 对 智能 机 器 人 的 信任 水 平 可 能 过 高 ， 也 
可 能 过 低 ， 前 者 为 过 度 信任 (Over-trust)， 后 者 为 信任 不 足 (Under-trust)。 过 度 信 任 会 导致 人 们 


对 智能 机 器 人 不 恰当 的 依赖 和 误 用 (Misuse), 信任 不 足 则 会 


导致 弃 用 (Disuse)。 信任 不 足 和 过 


度 信 任 都 会 破坏 人 机 交互 系统 的 价值 (Hancock et al., 2011), 因此 个 体 需 要 在 感知 可 靠 性 和 实 
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际 可 靠 性 之 间 进 行 准确 校准 (Calibration) 以 保持 恰当 的 信 自 


FE 水平 (Madhavan & Wiegmann, 


2007)。 当 个 体 拥 有 校准 良好 的 信任 时 ， 他 /她 就 知道 何 时 应 该 信任 机 器 人 ， 何 时 不 应 该 信任 


机 器 人 (Ali et al., 2022)。 人 机 信任 往往 通过 两 条 途 
与 信任 提升 。 信 任 抑 制 聚焦 于 如 何 降低 个 体 不 切实 际 的 较 高 信 作 


径 进行 校准 : 信任 抑制 (Trust dampening) 


E 水 平 ,信任 提升 侧重 于 如 何 


提升 个 体 过 低 的 信任 水 平 。 需 要 注意 的 是 ， 本 文 将 提升 个 体 过 低 信任 水 平 的 途径 命名 为 “ 信 


任 提 升 ”， 而 非 以 往 研 究 中 经 常 使 用 的 “信和 从 


EER” (Trust repair)。 我 们 认为 “信任 修复 ” 


强调 的 是 怎样 改善 个 体 在 机 器 人 出 现 信任 违背 (Trust violatiom 后 的 过 低 信任 水 平 ， 它 并 没有 


把 如 何 提升 个 体 初 始 信任 水 平 过 低 的 情况 包括 在 内 。 相 比 之 下 ， 
和 反映 该 校准 途径 的 内 容 。 国 外 研究 者 们 针对 人 机 信和 作 


“信任 提升 ”能 更 好 地 宫 括 


E 校 准 开 展 了 大 量 研究 (Alarcon et al., 


2020; de Visser et al., 2020; Ososky et al., 2013)， 考 察 了 人 机 信任 偏差 的 成 因 ， 并 提出 了 相应 


的 信任 校准 策略 , 但 这 些 研究 还 比较 分 散 , 缺乏 对 该 领域 实证 


目前 针对 人 机 信任 校准 策略 的 有 效 性 尚 存在 


争议 ， 


究 的 系统 整合 与 梳理 ; 另外 ， 
研究 大 多 只 关注 信任 偏差 的 其 


方面 (比如 信任 不 足 或 过 度 信任 )， 忽 略 了 从 整体 视角 去 整合 信任 偏差 、 信 任 校准 有 关 研 究 的 


必要 性 与 重要 性 。 基 于 此 ， 本 文 从 人 机 交互 中 可 能 


过 程 中 机 器 人 、 个 体 本 身 、 情 境 是 怎样 影响 信人 


Efi 


出 现 的 信任 4 
iM, DA 


局 差 成 因 入 手 ， 梳 理 人 机 交互 
I 何 通 过 信任 提升 与 信任 抑制 


两 条 途径 校准 人 机 信任 、 纠 正信 任 偏差 ( 见 图 1)， 本 文 也 试图 厘清 人 机 信任 校准 策略 的 边界 


条 件 ， 并 在 此 基础 之 上 提出 未 来 研究 


d 


ý 
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2 人 机 信任 偏差 


图 1 人 机 信任 1 
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在 本 文中 ,我们 将 个 体 在 人 机 交互 中 表现 出 来 的 过 度 信任 和 信和 作 


F 不 足 统称 为 人 机 信任 偏 


Ze, 即 个 体 由 于 对 机 器 人 能 力 的 错误 估计 导致 信任 偏离 校准 值 。 人 机 信任 人 


任 比 人 类 更 不 可 靠 的 算法 ， 或 不 信任 比 人 类 更 可 靠 的 香 
2.1 人 机 信任 偏差 的 危害 


法 (Dzindolet et al., 2003). 


j 差 会 导致 个 体 信 


过 度 信 任 往往 出 现在 个 体 认 为 机 器 人 具备 人 类 没有 的 功能 , 或 个 体 期 望 机 器 人 能 帮助 他 


们 降低 风险 的 情境 下 (Borenstein et al., 2018; Parasuraman & Riley, 1997)。 过 度 信 任 会 直接 


致 个 体高 估 机 器 人 的 能 力 ， 亦 常常 伴随 有 决策 错误 的 风险 ， 例 如 盲目 地 接受 机 器 人 智能 体 


(Agenb 提 出 的 所 有 诀 策 方案 却 不 加 考虑 该 决策 是 否 合 到 


已 
J 


过 度 信任 有 时 甚至 会 对 个 体 的 生命 造成 威胁 。Borenstein 等 人 (2018) 发 现 尽 管 目前 最 先进 


机 器 人 外 骨骼 只 能 在 低速 慢 走 等 有 限 条 件 下 为 运动 残疾 儿童 提供 一 定 的 辅助 功能 , 但 是 仍 有 
很 多 运动 残疾 儿童 的 家 长 认为 当 他 们 的 孩子 进行 某 些 风险 运动 (例如 攀 疏 ) 


B(Khavas, 2021; Khavas et al., 2020); 


的 


时 ， 外 骨骼 也 可 以 


保护 他 们 的 孩子 不 受伤 害 。 这 种 过 度 信任 机 器 (人 ) 带 来 的 危险 同样 出 现在 交通 驾驶 中 那些 


对 于 自动 驾驶 汽车 高 度 信任 的 司机 更 容易 在 驾驶 过 程 
2019)， 从 而 增加 出 现 交 通 事故 的 可 能 性 。 


与 过 度 信 任 相 比 , 信任 不 足 的 危害 较 小 , 但 是 对 了 


低估 算法 能 力 (Parasuraman & Riley, 1997)， 不 能 很 好 地 利用 算法 ， 也 无 法 享受 使 用 售 


算法 的 信任 不 足 往生 


会 


57] 


赴 个 


体 倾向 于 


出 现 打 睹 睡 的 情况 Kundinger et al., 


来 的 好 处 (Ali et al., 2022)， 最 终 在 人 机 协作 情境 中 恶化 整体 绩效 ， 降 低 人 机 团队 效率 


(Okamura & Yamada, 2020). 
2.2 人 机 信任 偏差 之 因 
2.2.1 与 机 器 人 有 关 的 因素 


可 靠 性 。 机 器 人 本 身 与 性 能 相关 的 因素 ， 在 人 机 交互 之 初 对 人 机 信任 的 影响 很 大 
(Robinette et al., 2017b)。 以 可 靠 性 (Reliability) 为 例 ， 它 指 代 机 器 人 性 能 具有 前 后 一 致 性 
器 人 的 可 


(Hancock et al., 2021) 。 一 个 可 靠 的 机 器 人 ， 应 该 具备 可 预测 、 性 能 稳定 等 特点 。 必 
靠 性 既 可 能 诱发 过 度 信任 ， 也 可 能 诱发 信任 不 足 (Shi et al., 2020). A 
到 机 器 人 的 能 力 是 可 靠 的 、 稳 定 不 变 的、 可 预测 的 ， 就 极 有 可 能 放松 对 机 器 人 的 实时 监测 ， 
表现 出 对 机 器 人 的 过 度 信任 ; 反之 则 容易 出 现 信任 不 足 。 正 如 前 文 所 述 ， 机 器 人 性 能 与 可 靠 


法 所 带 


体 来 说 ， 如 果 人 们 察觉 


性 密切 相关 ， 而 人 机 交互 之 中 机 器 人 错误 的 出 现 则 会 诱发 信任 违背 ， 导 致 信任 方 (个 体 ) 对 受 
信 方 (机 器 人 ) 的 信任 意向 或 信任 信念 降低 ( 严 瑜 ， 吴 起 , 2016; Kim etal., 2009). 错误 诱发 信任 


违背 的 原因 主要 有 二 : 一 是 错误 会 让 人 们 怀疑 算法 的 可 靠 性 较 低 ， 进 而 造成 信任 水 平 下 降 


(Alarcon et al., 2020; Correia et al., 2018; Lee & Moray, 1992); 二 是 人 们 往往 对 于 


Ate ye 


类 信息 的 敏感 性 较 高 , 无 法 容忍 算法 出 错 , 一 旦 算法 出 错 就 会 直接 弃 用 (Dietvorst et al., 2015). 


另外， 错误 发 生 的 频率 、 
发 生 的 越 频繁 、 越 严重 


严重 程度 、 


、 数 量 越 多 ， 就 会 导致 信任 水 平 下 降 速度 越 快 、 
人 的 明显 错误 以 外 , 一 些 意料 之 外 的 、 非 预期 行为 同样 也 会 导致 信任 违 


发 现 当 机 器 人 行动 路 线 人 


度 感 知 均 下 降 。 


=> 


E ABE 
TE 


观点 。 例 如 Sarkar 等 人 (2017) 指 出 ， 刍 


i 离 参与 者 原本 设 定 的 路 线 之 后 ， 


倒 会 看 起 来 更 不 


应 (Pratfall effect)" . Æ 


CU. SBT ATE BR (HEE BUT 77 t 28 2 Je DUE 


B E^ 
误 不 会 影 


数量 也 会 影响 信任 水 平 的 变化 (Rossi et al., 2017)， 错 误 


昼 度 越 大 。 除 去 机 器 


提 的 是 , 针对 错误 是 否 会 导致 个 体 对 机 器 人 的 信任 下 降 ， 有 和 
响 参 与 者 对 机 器 人 可 


机 协作 任务 绩效 ， 但 他 们 同时 也 承认 了 在 该 实验 中 任务 性 质 (任务 困难 


( 仅 涉及 认 知 错误 : 给 参与 者 错误 指导 ， 但 不 会 妨碍 其 完成 人 
机 器 人 的 错误 有 时 甚至 被 感知 为 可 爱 (Ragni etal., 2016)。 当 机 器 人 犯错 之 后 ， 人 们 会 觉得 它 


更 具有 人 类 相似 性 、 更 讨 人 喜欢 (Mirnig et al., 2017; Salem et al., 2013)， 一 个 完美 的 机 器 人 反 


“剪刀 石头 布 ”游戏 


背 。Lyons 等 人 (2023) 


参与 者 对 机 器 人 的 信任 感知 和 可 信 


究 者 提出 了 相反 的 
害 度 的 感知 和 后 续 的 人 


E 且 要 求 高 )、 犯 错 类 型 


然 (Biswas & Murray, 2015)。 这 也 印证 了 在 人 机 互动 


ESS) 


， 当 机 器 人 出 现 口头 作弊 (明明 输 了 却 声称 


素 的 影响 。 有 趣 的 是 ， 


同样 存在 “出 丑 效 


己 的 原本 答案 ) 时 , 相 比 于 无 作 浆 行为 的 控制 


组 机 器 人 , 人们 在 作 浆 条 件 下 与 机 器 人 的 社会 互动 明显 增加 ,也 更 容易 被 机 器 人 的 作 浆 行为 


所 逗乐 ， 尽 管 他 们 主观 上 认为 作弊 是 不 公平 的 (Short etal., 2010)。 


化 身 。 人 机 交互 


， 化 身 (Embodiment) 对 信任 也 有 一 定 影响 ， 化 身 是 指 机 器 人 的 形态 是 


实体 或 虚拟 (van Maris et al., 2017)， 主 要 划分 为 物理 化 身 (Physical embodiment) 和 虚拟 化 身 
(Virtual embodiment)。 物 理化 身 指 机 器 人 在 三 维 空 
由 移动 或 操纵 环境 (Haring et al., 2021); 而 虚拟 化 身 (从 
有 虚拟 身体 ,但 活动 范围 


虽然 


Li 


"3 


物理 化 身 会 


进行 交互 。 


态度 ， 将 机 器 人 视 为 社会 行动 者 (Social actor), HET XA 
当 机 器 人 的 位 置 非常 显眼 ， 会 无 形 增 大 个 体 依赖 于 它们 的 概率 (Robinette et al., 20172). 
相对 于 远程 呈现 机 器 人 ， 当 机 器 人 是 以 实体 形态 与 参与 者 交互 
高 。 在 实体 机 器 人 形态 条 件 下 ， 尽 管 参与 者 都 


IK 


尤其 


Bainbridge 等 人 (2011) 发 现 ， 
时 ， 参 与 者 对 机 器 人 不 寻常 命令 的 服从 率 会 更 
MX, 但 22 名 参与 者 中 有 12 名 还 是 听从 机 器 人 的 指示 将 书本 扔 进 了 垃圾 桶 ; 


RRIF FI A 


受 限 制 。 相 较 于 虚拟 呈现 ， 人 们 
通过 社会 临场 感 (Social presence) 影 响 信 任 , 唤起 个 体 对 机 器 人 的 积极 


1E HE A 


比 之 下 ， 远 程 呈 现 机 器 人 条 件 下 仅 


2 或 3 名 参与 者 服从 了 这 


研究 中 服从 机 器 人 的 命令 被 视 为 参与 者 信任 机 器 人 的 表现 。 


具备 一 个 有 形 的 、 物 理 的 身体 ， 能 自 
| 如 虚拟 机 器 人 ) 仅 呈现 在 


, 子 屏幕 上 ， 
更 喜欢 与 物理 呈现 的 机 器 人 


会 化 反应 (Jung & Lee, 2004). 


相 


需要 说 明 的 是 ,在 该 


个 命令 。 


2.2.2 与 个 体 有 关 的 因素 


动机 。 过 度 信 任 可 能 出 于 人 们 社会 惰 


生 (Social loafing) 的 动机 ， 即 相 较 于 


己 单 独 工 作 ， 


人 机 协作 中 个 体 付 出 的 努力 更 少 (Onnasch & Panayotidis, 2020; Parasuraman & Manzey, 2010). 


当 个 体 与 机 器 人 一 起 工作 时 , 责任 可 能 在 个 体 和 机 器 人 之 间 分 散 ， 


可 能 出 现 “搭便 车 ”效应 (Dzindolet et al., 2002)。Cymek 等 人 (2023) 的 研究 中 发 现 ， 尽 管 单 
组 和 与 机 器 人 协作 组 
发 现 单独 工作 组 的 参与 者 明显 比 机 器 人 协作 组 


THE 


独 工作 


实验 阶段 前 四 分 之 三 的 时 间 
段 放松 警惕 ， 未 能 及 时 察觉 出 机 器 人 犯错 。 

自我 信心 。 当 个 体 的 自我 信心 超过 对 自动 化 的 信任 时 , 个 体 更 可 
个 体 对 自身 信心 不 足 ， 则 可 能 转向 依赖 于 自动 化 LLee & Moray, 1994)。 在 后 一 种 情况 
下 极 易 诱发 过 度 信 任 ， 不 仅仅 因为 人 们 认为 外 
也 因为 与 人 类 决策 相 比 , 算法 决策 更 为 可 靠 、 更 准确 


法 专家 系统 无 论 法 律 案 


ri. 
45 


Ik 


2021)、 更 弱势 ， 


Dijkstra(1999) WHA, $ 


的 参与 者 都 日 我 


任务 


ku 


的 参与 者 任务 绩效 更 
， 机 器 人 协作 组 发 现 机 器 人 的 可 靠 性 


因此 人 机 协作 情境 中 更 有 


BAT AGE 


[ 作 绩 效 


。Cymek 等 人 推测 在 


因此 在 任务 最 后 阶 


法 较为 权威 ， 而 人 类 


与 者 最 后 需要 评估 是 否 接受 该 系统 的 意见 。 研 究 结果 发 


听从 人 类 律师 辩护 词 的 建议 )， 但 他 们 最 终 更 乐于 


的 具体 情况 如 


TRAY © ABLE RA 


A 


appreciation) 


积极 趋 近 算法 决策 ， 进 而 表现 


算法 或 人 类 决策 的 正确 性 ， 当 参与 者 认为 决策 是 来 自 外 
策 内 容 实质 是 一 样 的 , 他 们 也 更 容易 依赖 算法 , 且 这 种 算法 欣赏 效应 具有 跨 主客 观 人 
致 性 ,个 体 对 于 机 器 人 过 高 的 信任 也 隐 含 了 对 机 器 人 的 怕 


2020)。 算 法 欣赏 可 能 与 高 期 望 有 关 。 期 望 越 高 ， 初 始 信任 水 平 就 会 越 高 。 


VER (Algorithm aversiom) 就 


E. Logg 等 人 (2019) 发 现 , B 


法 而 不 是 人 类 时 ,即使 


生 人 机 交互 中 依靠 自 


的 权力 更 小 (Shank et al., 
(Mosier & Skitka, 1996). 
可 总 是 认定 罪犯 有 罪 , 参 
岗 ， 尽 管 参与 者 有 更 好 的 选择 (例如 
听从 算法 专家 系统 的 建议 ， 即 使 建议 是 错 
听从 算法 专家 系统 的 参与 者 对 算法 专家 系统 的 评价 更 积极 , 权威 依从 得 分 更 
高 。Xu 等 人 (2018) 也 发 现 相 对 于 人 类 治疗 师 而 言 ， 人 们 更 加 信任 机 器 人 治疗 师 ， 

有 过 度 信任 的 风险 。 

算法 态度 。 算法 态度 是 个 体 对 算法 的 认 知 、 
是 两 种 典型 的 算法 态度 。 算 法 


上 对 于 算法 的 过 度 信人 


并 且 伴 随 


情感 和 行为 倾向 的 总 和 。 算 法 欣赏 (Algorithm 
赏 会 促使 个 体 
使 无 法 判断 
者 给 出 的 决 


FE 务 的 一 


能 期 望 (Lyons et al., 2020; Shin et al., 


面 ， 高 期 望 


来 自 于 对 机 器 人 外 表 的 认 知 ， 例 如 机 器 人 的 拟人 化 (Anthropomorphism) 会 增强 个 体 信 任 (van 


Pinxteren et al., 2019); 另 一 方面 ， 高 期 望 可 能 是 缺失 真实 互动 体验 的 结果 。 例 如 在 


项 研究 


中 ， 当 机 器 人 在 完成 任务 的 同时 报告 “Q 值 ”( 一 串 数 字 代码 )， 结 果 不 管 是 否 具 备 AI 知识 


经 验 的 参与 者 者 


BUA AI 更 加 可 靠 ， 认 为 


ER 


ELH 


E 解 的 AI 越 聪 明 (Ehsan et al., 2021). 


低 信 任 水 平 也 与 算法 厌恶 息息相关 。Chiarella 等 人 (2022) 发 现 ， 两 幅 由 同一 位 画家 用 不 
同色 彩 的 颜料 创作 的 绘画 作品 ， 仅 仅 通 过 操纵 画作 著者 是 人 类 还 是 AI， 就 会 影响 人 们 对 于 
画作 的 审美 评分 ， 有 具体 表 现 为 人 们 对 “AI” 作 品 的 评分 更 低 。 算 法 厌恶 可 能 是 由 于 目前 大 
众 对 机 器 人 的 实际 接触 较 少 ， 加 之 某 些 网 络 媒体 对 AI 威胁 的 恐吓 性 报道 和 大 肆 宣 扬 (例如 
AI 会 统治 世界 、 未 来 将 发 生 人 机 大 战 等 ) Demir et al., 2019)， 无 形 中 加 剧 个 体 对 机 器 人 的 负 
iis E, 进而 造成 个 体 对 机 器 人 的 消极 印象 。 算 法 厌恶 也 可 能 是 消极 信任 转移 (Trust transfer) 
的 后 果 (Okuoka et al., 2022)， 如 果 个 体 之 前 对 于 计算 机 、 手 机 等 机 械 类 产品 有 较 糟糕 的 使 用 
体验 与 经 历 ， 这 种 消极 态度 也 会 迁移 到 与 算法 有 关 的 新 兴 产 品 上 (Lee & Kolodge, 2020)。 

心理 模型 。 心 理 模型 (Mental models) 是 经 过 组 织 的 知识 结构 ， 亦 是 对 工作 环境 的 认 知 表 
征 ;， 人们 使 用 心理 模型 来 预测 和 解释 他 们 周围 世界 的 行为 ， 并 建构 预期 ( 杨 正 宇 等 , 2003)。 
在 人 机 交互 的 研究 中 , 心理 模型 可 以 帮助 个 体 更 好 地 通过 线索 推断 机 器 人 的 内 在 状态 、 并 预 
测 它 的 能 力 (Lee et al., 2005)。 但是， 由 于 心理 模型 是 建立 在 个 人 经 验 的 基础 之 上 的 ， 如 果 有 
新 的 经 验 发 生 , 心理 模型 也 会 随 之 改变 , 因此 个 体 之 间 的 心理 模型 很 可 能 各 不 相同 (Miiller et 
al., 2023)。 人 机 信任 校准 的 前 提 是 人 们 能 正确 、 全 面 、 客 观 地 看 待机 器 人 的 优势 与 劣势 ， 换 
句 话说 , 个 体 需要 具备 恰当 的 心理 模型 以 表征 和 理解 机 器 人 的 能 力 。 举例 来 讲 , 人 机 交互 中 ， 
只 有 当 机 器 人 发 出 的 信号 被 人 类 用 户 恰当 解释 时 ， 人 类 才 可 以 预测 和 理解 机 器 人 的 行为 
(Breazeal, 2003)。 因 此 ， 如 果 个 体 拥 有 对 机 器 人 恰当 的 心理 模型 ， 就 能 较 好 地 校准 信任 ， 反 
之 则 会 由 于 对 机 器 人 的 能 力 估计 错误 而 导致 信任 偏差 (Ososky et al., 2013). 

2.2.3 与 情境 有 关 的 因素 

风险 与 时 间 压 力 。 高 风险 条 件 或 许 会 增 大 个 体 信 任 机 器 人 的 概率 。Robinette 等 人 (2016) 
研究 中 ， 参 与 者 在 机 器 人 的 带领 下 前 往 会 议 室 。 机 器 人 的 带领 路 线 有 两 种 类 型 ， 一 种 是 迁 回 
的 低 效 率 路 线 ， 一 种 是 不 迁 回 的 高 效率 路 线 。 采 用 迁 回 路 线 带领 参与 者 前 往 会 议 室 的 机 器 人 
被 视 为 低能 力 的 机 器 人 。 当 参与 者 到 达 会 议 室 后 听 到 警报 ， 需 在 一 分 钟 之 内 立刻 逃离 这 栋 大 
楼 。 所 有 的 参与 者 都 跟随 了 机 器 人 ， 甚 至 忽略 了 之 前 机 器 人 的 低能 力 。 时 间 压 力也 会 加 必 
度 信 任 ， 如 果 参 与 者 感知 到 时 间 紧 迫 ， 更 有 可 能 向 机 器 人 寻求 帮助 ， 尽 管 之 前 已 经 观测 到 它 


过 


E 


出 现 过 错误 (Xu & Howard, 2018). 

决策 领域 特点 。 有 研究 者 认为 , 与 人 类 相 比 ， 人 们 对 于 算法 是 厌恶 或 欣赏 的 关键 决定 因 
素 是 该 智能 体 背后 的 专业 能 力 (Hou & Jung, 2021)。 如 果 个 体 认为 算法 在 某 方面 的 专业 能 
不 及 人 类 ， 则 有 可 能 出 现 算 法 厌恶 。 璧 如 在 医疗 诊断 中 ， 人 们 在 大 多 数 情况 下 会 认为 人 类 决 
策 优 于 算法 决策 , 一 方面 是 因为 人 类 决策 会 让 个 体感 到 更 有 尊严 , 相 比 之 下 算法 决策 会 给 人 


们 带 来 非 人 化 (Dehumanization) 体 验 (Formosa et al., 2022)。 而 另 一 方面 ， 当 涉及 到 需要 进行 


自我 披露 时 ， 与 机 器 人 相 比 ， 人 们 也 更 愿意 去 信任 人 类 ， 对 人 类 的 披露 欲 也 更 强 
2021)。 与 此 同时 ， 决 策 领域 的 确定 性 程度 也 会 影响 人 们 是 否 使 
定性 的 增加 ， 人 类 和 算法 


人 确 


更 不 能 接 


误差 更 大 的 人 类 判断 (Dietvorst & Bharti, 2020). 3X 


人 类 决策 , 算法 决策 更 加 不 公平 、 不 值得 信赖 , 甚至 全 


2018)。 


we 


X 


完美 ”的 入 


之 间 的 绩效 差异 逐渐 缩小 ， 相 对 于 


法 犯错 。 因 此 ， 对 错误 敏感 怕 


ER. 


3 人 机 信任 校准 的 途径 


人 机 信任 校准 
却 未 被 察觉 或 意外 做 日 
al., 2020); 信任 提升 定义 为 用 
念 和 意愿 更 加 积极 的 活动 (Kim et al., 2004)。 下 面 将 分 别 从 机 器 人 、 个 体 、 环 境 三 方面 介 


括 信任 抑制 与 信任 提升 两 条 途径 
正确 决策 后 , B 


法 的 1 


算法 。 随 着 决策 领域 
“不 完美 ”的 人 类 犯错 ， 人 们 
降低 的 个 体 将 倾向 了 
高 见 或 是 人 们 感知 到 相 较 于 


ER(Barfield, 


不 


依赖 风险 更 高 、 


| 


对 应 的 具体 信任 校准 策略 。 


E 初 始 交互 时 ， 亦 或 是 信任 


法 犯错 后 还 会 引发 更 多 的 负面 情绪 (Lee， 


( 见 表 1)。 信 任 抑制 是 指 当 机 器 人 犯错 
在 降低 个 体 不 切实 际 的 高 信任 水 平 的 活动 (de Visser et 


ret 


违背 后 


， 旨 在 使 信任 方 的 较 低 


言 任 信 


表 1 国外 部 分 人 机 信任 校准 研究 汇总 
信任 校准 途径 机 器 人 类 型 言 任 测 量 研究 的 信任 阶段 体 校准 策略 
Bucinca et al., 2021 AEH 虚拟 人 工 智 能 ”信任 单 维 测量 + 行为 测 人 工 智 能 给 出 建议 解释 + 认 知 强迫 训练 
后 
Beller et al., 2013 ERI 自动 化 驾驶 系 ”信任 单 维 测量 + 行为 测量 ” 每 轮 交 互 结束 之 后 呈现 不 确定 性 信息 
统 
Wang et al., 2018 ESM Hil 机 械 机 器 人 / 人 际 信任 量 表 改 编 每 轮 交 互 结束 之 后 解释 + 化 身 
动物 机 器 人 
Lyons et al., 2023 ATES 机 械 机 器 人 人 际 信任 量 表 改 编 机 器 人 出 现 非 预 期 ” 承认 自己 的 过 失 + 解 释 
行为 前 后 非 预 期 行为 出 现 的 原因 
Kim & Song, 2021 言 任 提升 虚拟 智能 代理 。 人 -机 器 信任 问卷 改编 + ” 每 轮 交 互 结束 之 后 拟人 化 + 道歉 
行为 信任 测量 (依从 性 ) 
Sebo et al., 2019 FEHER 类 人 机 器 人 人 际 信任 问卷 改编 + 行为 人 机 交互 之 后 否认 + 道歉 
测量 


NAO ES 


3.1 与 机 器 人 有 关 的 信任 校准 策略 


透明 度 提 升 。 提 升 机 器 人 透明 度 既 可 以 有 


明 于 降低 过 度 信任 (de Visser et al., 2020), 同时 也 


可 以 用 于 提升 信任 不 足 (Lyons et al., 2017)。 但 总 体 而 言 ， 透 明度 常常 用 于 纠正 过 度 信 任 。 透 


明度 包括 向 月 


统 (Seong & Bisantz, 2008)。 算 法 需 


tr 


日 户 提供 关于 模型 如 何 工作 


要 具备 可 下 


的 相关 信 
tg 


的 底层 运行 机 制 ， 信 任 # 
speechb)， 把 机 器 人 做 日 


IEW 


地 使 月 


H 
i| 


2018; Geraci et al., 2021), Mitt dtl 


Hf 


Ji 


息 (Bhatt et al, 2020)， 以 帮助 他 们 玫 


E(Understandability)， 让 月 


H 


里 解 该 系 
昌 户 了 解 算 法 内 部 


法 系统 。 透 明度 还 包括 公开 机 器 人 的 内 在 言语 (Inner 
决策 的 推理 过 程 、 动 机 过 程 、 目 标 和 行动 计划 展现 给 月 


HJ” (Chen et al., 


王 。 机 器 人 也 可 以 及 时 


££, 


网 如 通过 语音 的 方式 传达 它 对 于 决策 


BRAN 


正确 


向 用 户 提供 有 关 性 能 的 反馈 ， 


VE l'E(Okamura & Yamada, 2020)。 正 如 


前 文 所 述 ， 可 预测 愧 


Exe b Ls A n] SE PERS 8 


要 组 成 部 分 之 


tr 


时 ， 个 体 就 无 法 对 机 器 人 的 可 靠 性 进 
暗示 机 器 人 可 能 在 后 续 


的 交互 过 程 


行 准 而 


和 评估。 天 


此 ， 通 过 


。 当 机 器 人 性 能 不 稳定 、 不 可 预测 


十 向 用 户 传达 (性 能 ) 不 确定 性 ， 


出 现 性 能 下 降 的 情况 ， 有 利于 抑制 过 高 信任 。Beller 等 


人 (2013) 通 过 驾驶 模拟 任务 检验 不 确定 性 ( 即 自动 区 驶 汽车 在 性 能 不 确定 的 情况 下 出 现 一 个 
"IH XS SEXE T T] emoji) 在 信任 校准 中 的 作用 。 研 究 显 示 ， 与 控制 组 相 比 ， 不 确定 组 能 降低 用 
户 对 于 自动 驾驶 汽车 的 依赖 ,提醒 用 户 为 自动 化 故障 做 好 准备 ， 并 能 促使 用 户 更 主动 、 更 快 
地 处 理 自 动 化 驾驶 汽车 的 故障 。 不 确定 组 的 参与 者 也 更 能 在 驾驶 任务 中 集中 注意 力 ， 更 不 容 
易 被 其 他 无 关 刺 激 所 干扰 。 该 研究 结果 与 Kunze 等 人 (2019) 基 本 一 致 ， 不 确定 性 反馈 有 助 于 


用 户 调整 注意 力 的 分 配 , 进而 校准 信 伯 
因 不 确定 性 呈现 虽 会 有 利 了 


(Kunze et al., 2019). 


显示 
况 下 依赖 自己 的 类 
将 有 助 于 飞行 员 在 人 
性 的 估计 也 


人 确 


EB aA 


Wi 


解释 。 可 解释 的 Al(Explainable AI , XAD Af ]1E f 


Berrada, 2018)， 亦 是 信任 抑 旬 
意义 解释 ， 同 时 也 可 向 


Ke, VAS AI 给 


]P XE 


上 错误 决策 时 能 被 
机 器 人 的 “黑匣子 ”(Black box) jE t 


打开 “ 黑 划 子 ”， 或 许 能 降低 个 体 过 高 的 信人 


FF 信任 校准 ， 但 可 


|r. McGuirl 和 Sarter(2006) RF, 如 果 


J 


FL Ha BOI E $87 1358 8] EE B] RZ — (de Visser et al., 2020)。 信 心 指 数 即 AI EH 
LE 论 上 人 们 应 该 在 AI 报告 信心 指数 高 的 情况 下 依赖 AL, E 
动 化 能 提供 动态 更 新 的 信心 指数 
CE 和 是 否 遵守 自动 化 系统 的 建议 等 方面 
加 精准 。 类 似 的 ， 在 人 机 交互 中 ， 如 果 机 器 人 能 经 常 向 
件 任务 的 信心 指数 ， 个 体 或 许 就 可 以 根据 该 指数 合 到 


分 本 


E 。 但 不 确定 性 信息 该 如 何 呈 现 则 需要 设计 师 仔细 其 酌 ， 
能 诱发 更 高 的 工作 负载 ， 从 而 降低 任务 绩效 


心 指数 低 的 情 


做 


更 好 的 决策 , 对 系统 准 
j 户 提供 它 对 完成 某 


任务 给 机 器 人 。 


由 的 主要 策略 之 一 (Bucinca et al., 2021). XAI 需要 为 用 户 提供 有 


解释 (de Visser et al., 2020)， 它 通过 让 


EMR Hl FIBA 


EKF, FAR BD 


理 模 型 。Wang(2018) 等 人 发 现 ， 解 释 


9 利于 校准 参与 者 的 信人 


校准 信任 的 必要 组 成 部 分 (Adadi & 


JP T fit AI 的 决策 过 


色 。 人 们 之 所 以 对 机 器 人 的 期 望 过 高 ， 
E 有 可 能 是 其 中 的 重要 因素 。 如 果 在 人 机 交互 之 前 能 及 时 
个 体 建 立 起 对 于 机 器 人 的 良好 心 


E， 从 而 帮助 参与 者 更 好 地 做 出 


决策 。 当 机 器 人 没有 给 
下 ， 当 机 器 人 提供 解释 时 ， 参 与 者 对 
步 纠 正 个 体 对 于 机 器 人 高 可 靠 性 的 期 待 , 例如 机 器 人 明确 地 告知 用 户 自 
己 能 够 执行 的 任务 和 功能 范围 ， 从 而 避免 个 体 出 现 滥 

与 此 同时 ， 人 机 交互 中 当 机 器 人 出 现 错误 时 ,适当 的 解释 有 利于 个 体 更 


人 的 局 限 也 可 以 进 


任何 解释 时 


， 参 与 者 会 过 度 信 任 机 器 人 进而 导致 决策 失误 。 相 比 之 
机 器 人 的 依从 率 就 降低 了 。 除 此 之 外 ,适当 地 传达 机 器 


日 机 器 人 的 情况 (de Visser et al., 2020). 
好 地 了 解 错 误 发 


生 的 机 制 ， 并 通过 给 出 相关 证 据 来 加 强 解释 的 说 服 力 ， 从 而 提升 信任 。 解 释 包 括 说 明 错 误 发 


(Bhatt et al., 2020; Lyons et al., 2023)、 提 出 


户 的 知识 背景 相 匹 配 (Adadi & Berrada, 2018; Kim & Hinds, 2006)， 如 果 提 供 一 个 过 于 专业 化 


的 术语 解释 ， 反 而 会 让 


]P 3GLR EK, 


fili(Papenmeier et al., 201 


等 人 (2018) 的 研究 


水 平 下 降 。 


9)， 


生 的 原因 (Correia et al., 2018)， 承 认错 误 事件 的 发 生 并 给 出 一 个 能 够 推断 出 因果 关系 的 理 


解决 问题 的 办 法 (Hald et al ., 2021)。 解 释 需 要 与 用 


并 降低 机 器 人 的 透明 度 。 然 而 ， 解 释 有 时 也 会 弄 巧 成 
它 是 否 有 效 可 能 跟 该 错误 导致 的 后 果 是 否 严 重 有 关 。 在 Correia 
， 机 器 人 与 参与 者 合作 完成 拼凑 七 巧 板 的 任务 。 当 机 器 人 突然 出 现 语音 
故障 导致 游戏 暂停 时 ， 只 有 当 参 与 者 和 机 器 人 可 以 继续 完成 剩 下 的 任务 时 ,机 器 人 的 解释 才 


有 效 ， 当 需要 重启 游戏 时 ， 解 释 就 无 用 了 ， 甚 至 在 这 


承诺 。 承 诺 适用 于 1 


情形 下 的 解释 还 会 导致 参与 者 的 信任 


T 


E 直 型 违背 或 能 力 型 违背 ， 前 者 侧重 于 被 信任 方 (Trustee) 因 为 他 /她 的 


诚实 品质 问题 而 造成 信任 方 (Trustor) 的 信任 下 降 ， 后 者 则 强调 被 信任 方 因 能 力 不 足 而 没有 达 


到 信任 方 的 期 待 造成 信任 下 降 ( 严 瑜 , 吴 霞 , 2016). 承诺 不 仅 包括 了 信任 违背 之 后 机 器 人 给 予 


人 类 的 承诺 , LAM TAKEJ 


Et 给 予 机 器 人 的 承诺 。 针 对 前 一 类 ，Esterwood 和 Robert(2022) 


发 现 ， 当 个 体 之 前 对 机 器 人 的 积极 态度 高 时 ， 承 诺 对 修复 信任 最 有 效 。 承 诺 通过 保证 个 体 对 


机 器 人 所 持 的 态度 是 正确 的 来 强化 个 体 的 积极 态度 , 进而 减少 认 知 失调 , 更 有 利于 信任 修复 。 


针对 后 一 类 ，Sebo 等 人 (2019) 发 现 ， 如 果 人 类 与 机 器 人 在 交互 前 事先 进行 了 互惠 性 承诺 ， 也 


就 是 以 不 伤害 对 方 的 前 提 下 公 习 


竞争 ,即使 在 任务 中 机 器 人 要 赖 ; 


欺骗 了 参与 者 , 事后 相 较 


于 没有 做 出 事前 互惠 承诺 的 个 体 ， 参 与 者 仍 报告 了 对 机 器 人 较 高 的 信任 。 
道歉 。 道 歉 是 人 机 交互 中 修复 信任 最 常见 的 方法 ， 它 适用 于 能 力 型 信任 违背 (Quinn， 


2018)。 道 歉 被 定义 为 承认 自己 因 信 任 违背 行为 所 带 来 的 责任 ,并 表达 遗憾 Kim et al., 2004). 


道 歉 常常 会 跟 归 因 相 联系 。 例 如 Kim 和 Song(2021) 发 现 ， 当 发 生 信任 违背 后 ， 相 比 于 使 用 


外 部 归 因 道歉 策略 ， 使 用 内 部 归 因 道歉 策略 的 类 人 化 虚拟 智能 体 更 能 修复 信任 ; 该 结果 恰恰 
与 类 机 器 虚拟 智能 体 相 反 。 当 机 器 人 表达 出 类 似 于 人 类 的 情绪 ， 例 如 遗憾 时 ， 相 较 于 没有 表 


现 出 遗憾 的 机 器 人 ， 参 与 者 对 其 信任 度 急 


剧 增 加 ; 当道 歉 既 包 括 遗 憾 的 语言 表达 ， 又 包括 解 


TERI, 180 
人 (2015) 通 


水 平 的 增长 尤为 明显 Kox et al., 2021)。 同 时 ， 
过 模拟 火灾 危机 情境 发 现 ， 在 信任 违 


道歉 时 机 也 


修复 信任 , 而 在 危机 时 刻 机 器 人 同 
器 人 前 往 紧急 出 
真诚 而 降低 信任 


E E BIER UE. 


O. fH Quinn(2018) 也 质疑 道歉 可 能 会 


imd 


样 使 用 道 


因 


否认 。 和 否认 对 于 修复 正直 型 违 


关系 ， 既 不 承认 伯 
会 去 反 驶 与 质疑 , 而 不 是 
这 可 能 会 导致 个 体 对 违 


将 机 器 人 的 失败 暴露 于 人 类 面前 ， 


单纯 地 承 


E 何 责任 ， 也 不 表示 遗憾 Kim et al., 2004). 


Bt AK a 


背 十 分 有 效 (Sebo et al., 2019). 


韦 背 之 后 机 器 人 的 立刻 道 
钦 和 承诺 时 ， 大 部 分 的 参与 者 会 选择 重新 跟随 机 
为 机 器 人 反复 表达 内 次 和 感知 的 低 


否认 党 包括 


很 重要 。 
AAT EAS BEA CH 


HH 否认 外 部 因 


Robinette 等 


H 


pans 


ZR 


否认 给 予 


认错 误 , 同时 , 它 也 表明 一 


EF 行为 的 担忧 (Kim et al., 2004)。 但 


NZ 


性 或 无 法 厘清 故障 原因 时 ， 
机 器 人 出 现 正直 型 违背 后 给 予 否 


TU, BARBS SARIN aA 


了 信任 违 4 


此 者 一 个 机 


没有 必要 去 改正 行为 的 意向 ， 


HX TÉ 


个 体 处 于 在 高 工作 负载 条 件 , 且 无 法 验证 机 器 人 的 正直 
否认 可 能 是 一 种 更 安全 的 修复 策略 (Quinn, 2018)。 有 趣 的 是 ， 


是 有 60% 的 参与 者 会 选择 在 实验 


FE 水平 与 


对 机 器 人 进行 报复 (Sebo et al., 2019). 


指责 。 指 责 是 信任 修复 中 风险 较 大 的 一 种 策略 。 
且 最 好 让 机 器 人 在 引入 指责 归 因 时 ， 将 任务 失败 归结 于 机 器 人 


因 问 题 ， 


M 


ERE 


(Groom et al., 2010), 而 不 是 外 部 原因 (入 
过 内 部 指责 进行 解释 虽然 在 行为 信和 从 
和 仁爱 性 


相 比 于 外 部 指责 , 通 
参与 者 感知 到 更 强 的 正直 性 


PHAM, ta ot i 


OFA ELBE 


UK 


其 他 条 件 无 差异 , 但 


常 也 会 涉及 到 归 


己 内 部 的 原因 


法 设计 师 、 第 三 方 算法 、 人 类 同伴 )。 信任 违背 


之 后 ， 


(Jensen et al., 2019)。 同 样 , 也 3 


如 
归 因 
人 ( 尤 


Ax 


的 引入 亦 会 
是 参与 者 本 身 ) 的 机 器 人 会 


| 
SLAY 


类 指责 仅 强 调 是 自己 的 错误 而 不 去 指出 发 生 
导致 参 与 者 的 信任 感知 下 降 (Kaniarasu & Steinfeld, 2014)， 因 为 一 个 指责 他 
艾 的 机 器 人 同 检 


错误 的 原因 , 那么 ; 


让 参与 者 感到 愤怒 ， 但 一 个 自 凶 


wy 


不 被 信任 ， 尽 管 它们 很 诚实 地 指出 了 自己 的 错误 。 


拟人 化 。 拟 人 化 是 将 人 类 特 


ik Fe (VEN A 等 , 2017; Epley et al., 2007), 


HUKUK RZ TR A AoE, 如果 


女性 机 器 人 (高 温暖 与 体验 性 的 代表 ), 或 许 会 缓解 人 们 对 机 器 人 去 人 性 
卯 天 机 器 人 互动 的 参与 者 对 


2021). Toader 等 人 (2019) 证 实 , 与 
于 个 人 信息 的 披露 意愿 更 强 , 社 
投射 到 机 器 人 上 


征 ’ 


交感 知 和 服务 满意 度 也 明显 
能 会 让 参与 者 产生 “机 器 人 就 像 人 类 一 样 容易 出 错 ” 的 
性 (Trust resilience)， 帮 助 个 体形 成 有 关于 机 器 人 的 


因此 ， 拟 人 化 可 


认 知 (Aroyo et al., 2021)， 进 而 增加 信和 


动机 、 意 向 或 心 
它 可 以 用 于 


添加 一 


能 在 算法 


男性 聊天 机 器 人 相 比 ， 跟 女性 
高 。 由 于 


E 


提升 人 机 信任 。 因 
些 与 人 类 相似 的 高 情感 特征 ， 比 如 使 用 


FE 上 不 存在 显著 的 差异 , 但 是 却 能 让 
不 是 所 有 的 指责 都 有 效 ， 


这 个 时 候 机 器 人 的 指责 


理 状态 赋予 非 人 对 象 的 心 


也 让 人 


理 过 程 或 者 个 


hele y 


化 的 感知 (Borau et al., 


拟人 化 需要 将 人 类 特 


心理 模型 (Ososky et al., 2013)， 减 缓 错误 后 参与 者 的 信任 下 降 速 度 (de Visser et al., 2016)。 在 


项 研究 中 , 机 器 人 的 主要 任务 是 给 参与 者 递 四 


个 鸡蛋 让 参与 者 能 顺利 制作 鸡蛋 卷 。 相 比 于 


另外 两 个 不 能 交流 的 机 器 人 ， 一 个 能 交流 、 能 表达 
情 )、 但 偶尔 犯错 (运输 鸡蛋 过 程 不 慎 掉 落 一 颗 鸡 蛋 ) 的 机 器 人 更 受 参与 者 喜爱 ,甚至 当 它 犯 
错 之 后 ， 参 与 者 对 其 的 信任 程度 仍 不 亚 于 一 个 效率 高 (不 掉 落 鸡蛋 ) 但 沉默 的 机 器 人 


T 


(Hamacher et al., 2016). 


情绪 (例如 掉 落 鸡蛋 之 后 做 出 委 届 的 


然而 ， 拟 人 化 也 可 能 诱发 过 度 信任 。 用 户 可 能 会 过 度 信 任 拟人 化 程度 高 的 机 器 人 ， 因 为 


高 拟人 化 机 器 人 往往 会 被 知觉 为 更 可 靠 、 更 仁爱 、 更 诚实 ， 导 致 用 户 对 


的 熟悉 感 ， 从 而 诱发 对 其 类 人 的 预期 (Wagner et al., 2018). Al 


32 与 个 体 有 关 的 信任 校准 策略 


降低 机 器 人 的 拟人 化 特征 也 是 抑制 信任 的 方法 之 一 


机 器 人 产生 一 种 错误 


此 ， 对 于 初始 信任 较 高 的 个 体 ， 


增加 接触 。 增 加 接触 在 一 定 程 度 上 能 改变 个 体 对 机 器 人 的 态度 。 在 信任 提升 方面 ， 研 究 


证 实 曝光 效应 (Exposure effect) 同 样 存在 与 人 机 交互 之 


(Jessup et al., 2020; Wullenkord et al., 


2016)。 与 机 器 人 的 面对面 互动 会 减弱 人 们 对 机 器 人 的 警惕 (Haring et al., 2013)， 减 少 不 确 定 


初始 信任 。 有 趣 的 是 ， 仅 仅 通 过 帮助 机 器 人 按 


不 恰当 认 知 ， 最 终 提高 个 体 未 来 与 机 器 人 继续 接触 的 意图 


接触 也 可 以 在 一 定 程度 上 改变 个 体 对 于 算 


性 和 风险 感知 (Kraus, Scholz, Messner, et al., 2020)， 增 进 个 体 对 于 机 器 人 的 好 感 ， 提 升 人 机 


下 一 个 按钮 ， 相 较 于 没有 按钮 的 参与 者 来 说 ， 
参与 者 对 于 机 器 人 的 信任 水 平 也 会 更 高 (Ullman & Malle, 2017)。 总 而 言 之 , 与 机 器 人 的 实际 
接触 可 能 会 降低 个 体 对 机 器 人 的 负面 偏见 和 焦虑 , 纠正 个 体 过 去 对 于 机 器 人 可 能 构成 威胁 的 


(Wullenkord et al., 2016). 


法 不 恰当 的 欣赏 , 从 而 降低 过 高 信任 。 人 机 交 
互 经 验 已 被 证 明 与 自动 化 依赖 息息相关 (Goddard et al., 2012). Haring 等 人 (2013) 的 研究 中 ， 


与 机 器 人 交互 前 个 体 可 能 认为 机 器 人 较为 聪明 , 但 是 当真 正 与 机 器 人 交互 之 后 , 参与 者 对 机 


器 人 的 拟人 化 感知 、 智 力 感知 均 有 降低 。 该 研究 的 结果 在 Wullenkord 等 人 (2016) 的 研究 中 得 


到 了 重复 :参与 者 在 人 机 交互 前 认为 机 器 人 的 情绪 体验 性 较 强 ,但 是 真 1 


E 与 机 器 人 互动 之 后 ， 


他 们 便 会 逐步 意识 到 机 器 人 不 是 很 先进 , 可 以 体验 到 的 情绪 也 比 他 们 想 


A He 
全 市 


= 
Sd 


信任 的 效果 。 


降低 期 望 。 降 低 期 望 是 人 机 信任 抑制 的 方法 之 一 。 信 人 


过 程 中 根据 新 信息 不 断 校 准 对 机 器 人 性 能 的 期 望 , 因此 个 体 对 于 机 器 人 的 认 知 也 会 随 着 与 机 


IE A 


象 的 要 少 ; 相 比 之 下 ， 


组 ( 即 没 有 与 机 器 人 交互 过 ) 的 参与 者 仍然 秉持 着 机 器 人 能 力 较 强 的 观点 。 与 机 器 人 接触 


过 的 实际 经 验 使 个 体 对 机 器 人 能 力 认 知 开始 趋 于 正常 化 (Sanders et al., 2017)， 从 而 达到 校准 


E 的 动态 变化 特点 促使 个 体 在 交互 


器 人 交互 的 深入 而 不 断 更 新 (Kraus, Scholz, Stiegemeier, et al., 2020)。Pop 等 人 (2015) 发 现 ， 


对 自动 化 具有 高 期 望 的 用 户 虽 然 对 于 


动 化 可 靠 性 的 变化 更 为 敏 


RX, 但 却 不 一 定 会 具有 较 好 


的 信任 校准 能 力 。 当 自动 化 能 力 提 高 时 ， 用 户 的 信任 校准 较 好 ， 而 当 自 动 化 能 力 降低 时 ， 信 


因此 ， 如 果 个 体 对 机 器 人 的 期 望 较 高 ， 


任 校准 较 差 。 
法 。 通 过 预先 警 务 难度 、 提 醒 用 户 自 


Fe 
[m] 


该 任 


各 


可 能 


à 


1A 


LX 


进而 帮助 个 体重 新 设 定 他 们 的 期 望 (Lee et 


提高 算法 素养 。 算 法 素养 (Algorithm literacy) 主 要 包括 


Ar 十 
台 算 法 


平 
策 (4) 用 户 能 有 效 处 理 算法 运行 过 程 


是 如 何 被 使 用 的 (2) 用 户 知道 入 


算法 素养 就 可 以 与 机 器 人 顺利 交互 ， 并 从 机 器 人 的 解释 
(Naiseh et al., 2021)。 算 法 素养 可 以 通过 学 习 提升 ， 例 如 
的 风险 ， 并 列举 过 度 信任 机 器 人 的 优 劣 ; 机 器 人 运行 商 可 以 
助人 们 正确 地 了 解 机 器 人 (Aroyo et al., 2021)， 从 而 提升 个 


法 如 何 运行 (3) 


al., 2010)。 


事先 预警 (Forewarning) 是 比较 有 效 的 方 


皇 务 中 表现 不 佳 (de Visser et al., 2020), 


四 个 方面 : (1) 


过 


高 依从 性 。 其 次 ， 用 户 同样 可 以 通 
以 最 有 效 的 方式 来 校准 信任 。 
3.3 与 情境 有 关 的 信任 校准 策略 


m 


认 知 干预 、 增 加 认 知 资源 。 情 境 的 特 
力 下 的 个 体 往往 会 出 现 认 知 资源 过 载 的 情况 。 根 据 认 知 负荷 到 
而 认 知 负荷 又 分 为 内 在 认 知 负荷 和 外 在 认 知 负荷 。 内 在 认 知 负荷 
由 学 习 任务 产生 的 , 而 外 部 认 知 负荷 则 来 自 于 与 学 习 任 务 无 关 的 其 他 来 源 , 例如 环境 
个 体 的 认 知 负荷 较 高 容易 导致 个 体 无 法 准 
能 会 让 个 体 产 生 与 任务 无 关 的 内 在 认 知 负 
研 容 易 出 现 过 度 信任 算法 的 倾向 (Chien et al., 


的 工作 记忆 人 能力 是 有 限 的 ， 


主要 是 


(Sweller, 2011)。 从 该 理论 出 发 ， 人 机 交互 过 程 
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求 参 与 者 (1) 先 于 AI 做 出 决定 (2) 通 过 增加 AI 给 出 建议 的 时 间 去 放 缓 决策 过 程 (3) 让 参与 者 选 
择 是 否 以 及 何 时 查看 AI 建议 。 研 究 结果 表明 ， 认 知 干预 增加 了 参与 者 进行 分 析 性 思维 的 认 
知 动机 ， 进 一 步 减少 了 参与 者 对 AI 的 过 度 依赖 。 

增强 决策 领域 中 机 器 人 (算法 ) 的 优势 。Hou 和 Jung(2021) 认 为 ， 人 类 并 不 是 一 味 地 偏向 
于 算法 或 人 类 决策 , 个 体 实 质 偏向 的 是 算法 或 人 类 背后 的 专业 能 力 。 适度 在 算法 决策 背后 注 
入 专家 力量 有 利于 改善 个 体 原 先 的 消极 信任 态度 。 除 此 之 外 , 在 不 同 的 任务 领域 匹配 不 同乡 
表 的 机 器 人 可 以 帮助 个 体 更 好 地 接纳 机 器 人 ， 比 如 享乐 主导 的 服务 环境 中 , 个 体 对 像 儿 童 的 
高 热情 服务 机 器 人 表现 出 更 高 的 偏好 , 而 在 功利 主导 的 服务 环境 中 , 他 们 对 像 成 人 的 高 能 
服务 机 器 人 表现 出 更 高 的 偏好 (Liu et al., 2022)。 人 们 通常 厌恶 在 一 些 较为 主观 的 任务 中 使 用 
算法 , 但 如 果 能 在 这 些 看 似 主观 的 任务 中 强调 一 些 可 以 用 客观 事实 解释 的 部 分 , 也 可 以 降低 
主观 任务 的 “主观 性 ”, 使 参与 者 可 以 更 好 地 接受 算法 决策 。 比 如 告知 参与 者 歌曲 的 推荐 ( 主 
观 任 务 ) 一 定 程度 上 也 可 以 由 个 体 的 人 格 特质 (客观 性 ) 所 决定 , 这 时 个 体 对 于 算法 决策 的 信任 
会 增强 (Castelo et al., 2019)。 
4 未 来 研究 展望 

人 机 交互 已 经 逐渐 渗透 到 日 常生 活 的 方方面面 ， 而 信任 对 于 保持 团队 凝聚 力 至 关 重 要 
(Perkins et aL, 2021)。 然 而 ， 信 任 只 有 维持 在 恰当 的 水 平 才 能 促进 有 效 的 人 机 合作 。 一 旦 信 
任 出 现 过 高 或 过 低 的 情况 ， 就 会 对 人 机 合作 造成 一 定 的 威胁 ,因此 需要 对 信任 进行 校准 。 目 
前 针对 人 机 信任 校准 虽然 已 经 有 较 多 研究 成 果 的 积累 ， 但 是 仍 存在 不 足 和 值得 改进 的 地 方 。 
4.1 优化 校准 效果 评估 的 测量 方法 
第 一 , 从 测量 方法 上 看 , 在 人 机 信任 领域 已 经 有 研究 者 开始 采用 内 隐 方 式 考察 个 体 对 自 
动 化 的 信任 (Merritt et al., 2013)， 但 仍 限 于 个 体 信任 校准 之 前 对 自动 化 /机 器 人 的 信任 测量 ， 
未 涉及 到 个 体 在 人 机 交互 中 出 现 了 信任 偏差 并 进行 信任 校准 之 后 的 后 续 内 隐 信 任 测量 。 第 二 ， 
校准 信任 之 后 研究 者 们 往往 以 信任 量 表 得 分 或 信任 行为 等 外 显 信任 指标 作为 衡量 信任 修复 / 
抑制 效果 的 主要 方法 。 我 们 认为 ， 校 准 信任 之 后 不 仅 要 关注 个 体 的 外 显 信任 态度 ， 同 时 也 要 
关注 个 体 的 内 隐 信 任 态度 以 更 好 地 检验 校准 策略 的 有 效 性 与 实用 性 。 以 信任 抑制 为 例 ,未 来 
不 仅 可 以 通过 信任 量 表 检验 抑制 策略 是 否 有 效 , 亦 可 通过 内 隐 联 想 测验 探讨 信任 抑制 后 个 体 
的 内 隐 信 任 水 平 是 否 也 有 降低 ， 对 比 信任 抑制 策略 在 降低 外 显 信 任 和 内 隐 信 任 之 间 的 差异 。 
4.2 揭示 信任 校准 的 认 知 神经 过 程 
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Trust dampening and trust promoting: A dual-pathway of 


trust calibration in human-robot interaction 


HUANG Xinyu, LI Ye 
(School of Psychology, Central China Normal University & Key Laboratory of Adolescent Cyberpsychology 
and Behavior, Ministry of Education, Wuhan 430079, China ) 

Abstract: Trust is the basis of successful human-robot interaction. However, humans do not 
always hold the appropriate level of trust in human-robot interaction, sometimes they may also fall 
into pitfalls: the trust bias, which contains both over-trust and under-trust. Trust bias can harm the 
human-robot interaction and so trust calibration is necessary. Trust calibration is often achieved 
through two ways: trust dampening and trust promoting. Trust dampening focuses on how to 
reduce the high level of trust in robots, while trust promoting focuses on how to improve the low 
level of trust in robots. For future directions, we suggest further optimize the measurement of 
methods. Besides, we also need to clarify the cognitive process and explore more boundary 
conditions. Finally, in order to boost human-robot collaboration, researchers are encouraged to 
explore personalized and specialized trust calibration strategies based on individual differences 
and further clarify the various reasons why trust bias occurs. 
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